智能论文笔记

Spatiotemporal Pattern Recognition in Single Mixed-Signal VLSI Neurons with Heterogeneous Dynamic Synapses

Mattias Nilsson , Foteini Liwicki , Fredrik Sandin

分类：神经与进化计算 | 人工智能

2021-06-10

具有大脑般的组织和设备物理学的混合信号神经形态处理器为传统深度学习和计算的不可持续发展提供了超低功率的替代方案。但是，意识到这种神经形态硬件的潜力需要有效利用其异质的，模拟神经突触电路，采用神经计算方法来稀疏，基于尖峰的编码和处理。在这里，我们研究了平衡兴奋性抑制性抑制性横向连接作为实施丘脑皮层启发的时空相关器（STC）神经网络的一种资源有效机制，而无需使用专用的延迟机制。我们提出了使用DynAP-SE神经形态处理器进行硬件的环境实验，其中在STC网络中，在STC网络中，无均匀重合检测神经元的接收场通过随机输入采样绘制，每个列中有四个侧向传入连接。此外，我们演示了如何调整这种神经元来检测特定的时空特征，该特征通过模拟突触电路的离散地址编程。双突触连接的能量耗散是每个横向连接（0.65 NJ vs 9.6 NJ）比STC的前一个基于延迟的硬件实现的数量级（0.65 nj vs 9.6 NJ）。

translated by 谷歌翻译

Can a face tell us anything about an NBA prospect? -- A Deep Learning approach

Andreas Gavros , Foteini Gavrou

分类：计算机视觉

2022-12-13

Statistical analysis and modeling is becoming increasingly popular for the world's leading organizations, especially for professional NBA teams. Sophisticated methods and models of sport talent evaluation have been created for this purpose. In this research, we present a different perspective from the dominant tactic of statistical data analysis. Based on a strategy that NBA teams have followed in the past, hiring human professionals, we deploy image analysis and Convolutional Neural Networks in an attempt to predict the career trajectory of newly drafted players from each draft class. We created a database consisting of about 1500 image data from players from every draft since 1990. We then divided the players into five different quality classes based on their expected NBA career. Next, we trained popular pre-trained image classification models in our data and conducted a series of tests in an attempt to create models that give reliable predictions of the rookie players' careers. The results of this study suggest that there is a potential correlation between facial characteristics and athletic talent, worth of further investigation.

translated by 谷歌翻译

Multi-Task Meta Learning: learn how to adapt to unseen tasks

Richa Upadhyay , Prakash Chandra Chhipa , Ronald Phlypo , Rajkumar Saini , Marcus Liwicki

分类：计算机视觉

2022-10-13

This work proposes Multi-task Meta Learning (MTML), integrating two learning paradigms Multi-Task Learning (MTL) and meta learning, to bring together the best of both worlds. In particular, it focuses simultaneous learning of multiple tasks, an element of MTL and promptly adapting to new tasks with fewer data, a quality of meta learning. It is important to highlight that we focus on heterogeneous tasks, which are of distinct kind, in contrast to typically considered homogeneous tasks (e.g., if all tasks are classification or if all tasks are regression tasks). The fundamental idea is to train a multi-task model, such that when an unseen task is introduced, it can learn in fewer steps whilst offering a performance at least as good as conventional single task learning on the new task or inclusion within the MTL. By conducting various experiments, we demonstrate this paradigm on two datasets and four tasks: NYU-v2 and the taskonomy dataset for which we perform semantic segmentation, depth estimation, surface normal estimation, and edge detection. MTML achieves state-of-the-art results for most of the tasks. Although semantic segmentation suffers quantitatively, our MTML method learns to identify segmentation classes absent in the pseudo labelled ground truth of the taskonomy dataset.

translated by 谷歌翻译

Identifying and Mitigating Flaws of Deep Perceptual Similarity Metrics

Oskar Sjögren , Gustav Grund Pihlgren , Fredrik Sandin , Marcus Liwicki

分类：计算机视觉

2022-07-06

衡量图像的相似性是计算机视觉的基本问题，不存在通用解决方案。尽管已显示出像素的L2-Norm这样的简单指标，例如L2-Norm具有很大的缺陷，但它们仍然受欢迎。一组最新的最新指标减轻了其中一些缺陷是深度的知觉相似性（DPS）指标，其中将相似性评估为神经网络深度特征的距离。但是，DPS指标本身还没有彻底检查其利益，尤其是其缺陷。这项工作研究了最常见的DPS度量，其中通过空间位置进行了比较的深度特征，并比较了平均和排序的深度特征。对指标进行了深入分析，以通过使用专门挑战它们的图像来了解指标的优势和劣势。这项工作为DPS的缺陷提供了新的见解，并进一步提出了对指标的改进。这项工作的实施可在线获得：https：//github.com/guspih/deep_perceptual_similarity_analysis/

translated by 谷歌翻译

Self-Supervised Consistent Quantization for Fully Unsupervised Image Retrieval

Guile Wu , Chao Zhang , Stephan Liwicki

分类：计算机视觉

2022-06-20

无监督的图像检索旨在学习有效的检索系统而无需昂贵的数据注释，但是大多数现有方法都严重依赖于手工制作的功能描述符或预训练的功能提取器。为了最大程度地减少人类的监督，最近的Advance提出了深度无监督的图像检索，旨在训练从头开始的深层模型，以共同优化视觉特征和量化代码。但是，现有方法主要集中于实例对比学习，而无需考虑基本的语义结构信息，从而导致了次优的性能。在这项工作中，我们提出了一种新型的自我监督一致的量化方法，以深度无监督的图像检索，该方法由一致的零件量化和全局一致的量化组成。在部分一致的量化中，我们通过CodeWord多样性正规化设计了部分邻居语义一致性学习。这允许将基础化表示的基本邻居结构信息视为自学。在全球一致的量化中，我们对嵌入和量化表示形式采用对比度学习，并将这些表示形式融合在一起，以在实例之间进行一致的对比度正规化。这可以弥补量化过程中有用表示信息的丢失，并在实例之间正规化一致性。我们的方法具有统一的学习目标和全球一致的量化，利用了更丰富的自学线索来促进模型学习。在三个基准数据集上进行的广泛实验表明，我们的方法优于最先进的方法。

translated by 谷歌翻译

A Survey of Historical Document Image Datasets

Konstantina Nikolaidou , Mathias Seuret , Hamam Mokayed , Marcus Liwicki

分类：计算机视觉

2022-03-16

本文介绍了用于文档图像分析的图像数据集的系统文献综述，重点是历史文档，例如手写手稿和早期印刷品。寻找适当的数据集进行历史文档分析是促进使用不同机器学习算法进行研究的关键先决条件。但是，由于实际数据非常多（例如，脚本，任务，日期，支持系统和劣化量），数据和标签表示的不同格式以及不同的评估过程和基准，因此找到适当的数据集是一项艰巨的任务。这项工作填补了这一空白，并在现有数据集中介绍了元研究。经过系统的选择过程（根据PRISMA指南），我们选择了56项根据不同因素选择的研究，例如出版年份，文章中实施的方法数量，所选算法的可靠性，数据集大小和期刊的可靠性出口。我们通过将其分配给三个预定义的任务之一来总结每个研究：文档分类，布局结构或语义分析。我们为每个数据集提供统计，文档类型，语言，任务，输入视觉方面和地面真实信息。此外，我们还提供了这些论文或最近竞争的基准任务和结果。我们进一步讨论了该领域的差距和挑战。我们倡导将转换工具提供到通用格式（例如，用于计算机视觉任务的可可格式），并始终提供一组评估指标，而不仅仅是一种评估指标，以使整个研究的结果可比性。

translated by 谷歌翻译

Magnification Prior: A Self-Supervised Method for Learning Representations on Breast Cancer Histopathological Images

Prakash Chandra Chhipa , Richa Upadhyay , Gustav Grund Pihlgren , Rajkumar Saini , Seiichi Uchida , Marcus Liwicki

分类：计算机视觉

2022-03-15

这项工作提出了一种新型的自我监督的预训练方法，以学习有效的表示，而没有在组织病理学医学图像上使用放大倍率的因素进行标签。其他最先进的工作主要集中在完全监督的学习方法上，这些学习方法严重依赖人类注释。但是，标记和未标记数据的稀缺性是组织病理学的长期挑战。当前，没有标签的表示学习仍未探索组织病理学领域。提出的方法是放大事先的对比相似性（MPC），可以通过利用放大倍率，电感转移和减少人类先验的宽度乳腺癌数据集中的无标签来进行自我监督的学习。当仅20％的标签用于微调和表现以前的工作中，在完全监督的学习环境中，该方法与恶性分类的最新学习相匹配。它提出了一个假设，并提供了经验证据来支持，从而减少人类优先导致自学中有效表示学习。这项工作的实施可在github-https：//github.com/prakashchhipa/magnification-prior-self-supervised-method上在线获得。

translated by 谷歌翻译

Sharing to learn and learning to share - Fitting together Meta-Learning, Multi-Task Learning, and Transfer Learning : A meta review

Richa Upadhyay , Ronald Phlypo , Rajkumar Saini , Marcus Liwicki

分类：机器学习

2021-11-23

整合不同域的知识是人类学习的重要特征。学习范式如转移学习，元学习和多任务学习，通过利用新任务的先验知识，鼓励更快的学习和新任务的良好普遍来反映人类学习过程。本文提供了这些学习范例的详细视图以及比较分析。学习算法的弱点是另一个的力量，从而合并它们是文献中的一种普遍的特征。这项工作提供了对文章的文献综述，这些文章融合了两种算法来完成多个任务。这里还介绍了全球通用学习网络，在此介绍了元学习，转移学习和多任务学习的集合，以及一些开放的研究问题和未来研究的方向。

translated by 谷歌翻译